Kimi团队发布K1.5:让AI像人类一样“边思考边学习”的突破性进展
这项由Kimi团队开展的研究发表于2025年6月3日,详细介绍了他们最新的多模态大语言模型Kimi K1.5的训练方法和技术突破。有兴趣深入了解的读者可以通过arXiv:2501.12599v4访问完整论文。
这项由Kimi团队开展的研究发表于2025年6月3日,详细介绍了他们最新的多模态大语言模型Kimi K1.5的训练方法和技术突破。有兴趣深入了解的读者可以通过arXiv:2501.12599v4访问完整论文。
这项由Kimi团队开展的研究发表于2025年6月3日,详细介绍了他们最新的多模态大语言模型Kimi K1.5的训练方法和技术突破。有兴趣深入了解的读者可以通过arXiv:2501.12599v4访问完整论文。
840亿估值的AI公司,成立半年没产品,投资人追着塞钱;如今甩出首个研究,直接把大模型的“精神分裂症”给治了——这不是爽文,是硅谷正在上演的现实。OpenAI前CTO Mira Murati带队,三分之二员工来自OpenAI,20亿美元种子轮创纪录,现在他们告
独角兽 推理 chatgpt 失忆 thinkingmach 2025-09-20 20:19 5
在人工智能领域,模型推理的准确性和可靠性是研究的核心。中国人工智能公司DeepSeek最近宣布,他们的DeepSeek-R1模型通过在推理过程中实现基于试错的强化学习,成功提高了其对数学和编程问题的理解能力。这一突破不仅在学术界引发了广泛关注,还引发了对行业未
应用 推理 deepseek 试错 中国deepseek 2025-09-20 19:17 7
当代作家柳青在《创业史》第一部下卷第二十五章中写道:“你看,俺互助组里,有能的,有不能的。十个指头不一般齐哩!一个地里长出来的粮食,就能粒粒都一样?那号光想占便宜,不想尽义务的人,叫他到旁人互助组里去!”
作为Ling 2.0架构系列的第三款模型,Ling-flash-2.0以总参数100B、激活仅6.1B(non-embedding激活4.8B)的轻量级配置,在多个权威评测中展现出媲美甚至超越40B级别Dense模型和更大MoE模型的卓越性能。
在娱乐圈的综艺舞台上,模仿秀总是能给观众带来无尽的欢乐和惊喜,而金靖模仿迪丽热巴的片段,无疑是近期综艺界的一大亮点。在《开始推理吧3》的录制现场,金靖就贡献了令人捧腹大
文章概述了多种 LLM 推理框架,包括 vLLM、Hugging Face TGI、SGLang、NVIDIA Dynamo、AIBrix 和 llm-d。它们在性能、可扩展性、编排和对不同部署场景的适用性方面各有优势,满足了低延迟、高吞吐量和异构硬件部署的需
本文第一作者谢之非,共同第一作者马子阳皆是来自于南洋理工大学的博士生。通讯作者为新加坡国立大学特聘教授颜水成和南洋理工大学数据与科学系校长讲席教授苗春燕。共同作者为腾讯AI首席专家叶德珩和新加坡国立大学博士后研究员廖越。
由芒果TV出品、芒果TV甘亿团队制作、峰值影业联合制作的《女子推理社》首部衍生短剧《羽刃》,于9月19日正式登陆芒果TV热点剧场首播。该剧作为剧场化短剧新模式的启航之作,率先打通“芒系综艺IP+短剧”生态开发路径,以强设定、快节奏的悬疑叙事开启平台短剧内容新篇
我们每天接触的信息纷繁复杂,除了客观事实,还夹杂着各种情绪、立场和偏见。如果缺乏有效的思维方式去分辨,很容易被片面言论牵着走,陷入盲从或信息孤岛。于是,“批判性思维”逐渐成为人们重视的能力。但很多人误以为批判就是反驳,就是挑毛病,其实不然。真正的批判性思维并非
9月18日,七牛智能(2567.HK)与润建股份旗下的五象云谷智算中心宣布战略合作。本次合作目标非常清晰:把AI推理算力做成普惠价,一起闯进千亿级AI推理市场。
9月18日,七牛智能(2567.HK)与润建股份旗下的五象云谷智算中心宣布战略合作。本次合作目标非常清晰:把AI推理算力做成普惠价,一起闯进千亿级AI推理市场。
今天分享一份中国联通研究院联合中讯邮电咨询设计院、联通数字科技有限公司联合编制的《算力网络人工智能模型推理算力度量研究报告》,报告系统性地提出人工智能模型推理算力度量理论与方法体系,为算力网络中模型推理的性能评估、智能调度与计量计费提供了技术支撑。
辛德勇是谁?他是大藏书家,他是著名文史学者,他是著述等身北大史学教授,他是现下自媒体一线大V,他是学界顶尖畅销书作家,他是微信公众号私房写真集极品男模,他美貌与智慧并存,他知名度与滑稽性兼备,他是当代正统史界第一人,他是线上野生谐星NO.1。夫子求备于一夫,能
它在AIME数学竞赛中以超人表现震撼世界,却因缺乏人类引导,成了只会“算数”的沟通障碍者。这篇论文不仅揭示了DeepSeek AI的秘密,更叩问了智能的本质与边界。
近日,北京大学联合新加坡国立大学、Sea AI Lab等机构的一篇新论文《Nav - R1: Reasoning and Navigation in Embodied Scenes》,在 embodied AI 领域掀起了波澜。
这项由字节跳动种子团队(ByteDance Seed)的辛然、肖霞等研究人员联合卡内基梅隆大学和北京大学开发的突破性研究发表于2025年9月,论文题目为《Scaling up Multi-Turn Off-Policy RL and Multi-Agent T
这项突破性研究由DeepSeek-AI团队于2025年1月发表在arXiv预印本平台上(论文编号:2501.12948v1),有兴趣深入了解的读者可以通过https://arxiv.org/abs/2501.12948访问完整论文。该研究团队开发出了两个革命性
以前写代码要学语法、调函数,现在用AI,靠的却是一句话:你怎么“说”,它就怎么“做”。